在提到聲音轉換的時候,我們第一個會想到的可能就像是柯南那樣 (他會把他叔叔麻醉然後用變聲器偽裝成他的聲音),而事實上我們想做的就是同樣的事情 (沒有麻醉的部分)
然而轉換聲音這件事情並不是一件很有創意的事,早在 5 年前的時候就有人成功了,甚至在 2018 年的時候有家叫 琴鳥 (Lyrebird) 的公司發表了一部影片,內容是複製了川普的聲音
公司的名字會叫做琴鳥的原因是因為這種鳥在自然界會模仿周遭所聽到的聲音,而且你不覺得叫琴鳥比叫八哥或鸚鵡好聽嗎?
你可以想像未來就算接到視訊電話,你也不見得能夠確定電話另一頭就是真正你認識的那個人,AI 的換臉技術加上聲音轉換技術如果都能夠到達 Real - Time 又高品質的水準的話,而這樣的未來似乎離我們不遠。
換句話說,也就是現在的水平或許還沒辦法那麼厲害,或是可能有一些限制,像是訓練困難等等
接下來的時間大致上會這樣安排做分享,還請大家多多指教!
一些程式碼會一併更新在 我的 GITHUB